home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9611 / 000132_owner-urn-ietf _Tue Nov 12 10:22:20 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  7KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id KAA19591 for urn-ietf-out; Tue, 12 Nov 1996 10:22:20 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id KAA19586 for <urn-ietf@services.bunyip.com>; Tue, 12 Nov 1996 10:22:17 -0500
  3. Received: from windrose.omaha.ne.us by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA01013  (mail destined for urn-ietf@services.bunyip.com); Tue, 12 Nov 96 10:22:11 -0500
  5. Message-Id: <9611121522.AA01013@mocha.bunyip.com>
  6. Received: by privateer.windrose.omaha.ne.us; Tue Nov 12 09:21 CST 1996
  7. From: "Ryan Moats" <jayhawk@ds.internic.net>
  8. To: "Dirk.vanGulik@jrc.it" <Dirk.vanGulik@jrc.it>,
  9.         "Harald.T.Alvestrand@uninett.no" <Harald.T.Alvestrand@uninett.no>
  10. Cc: "FisherM@is3.indy.tce.com" <FisherM@is3.indy.tce.com>,
  11.         "girod@LCS.MIT.EDU" <girod@LCS.MIT.EDU>,
  12.         "mduerst@ifi.unizh.ch" <mduerst@ifi.unizh.ch>,
  13.         "moore@cs.utk.edu" <moore@cs.utk.edu>,
  14.         "tallen@fsc.fujitsu.com" <tallen@fsc.fujitsu.com>,
  15.         "urn-ietf@bunyip.com" <urn-ietf@bunyip.com>
  16. Date: Tue, 12 Nov 96 09:22:43 
  17. Priority: Normal
  18. X-Mailer: PMMail 1.52 For OS/2 UNREGISTERED SHAREWARE
  19. Mime-Version: 1.0
  20. Content-Type: text/plain; charset="us-ascii"
  21. Content-Transfer-Encoding: 7bit
  22. Subject: [URN] Re: Harald's syntax proposals [Somewhat Long] (was I18N does not belong in URNs)
  23. Sender: owner-urn-ietf@services.bunyip.com
  24. Precedence: bulk
  25. Reply-To: "Ryan Moats" <jayhawk@ds.internic.net>
  26. Errors-To: owner-urn-ietf@bunyip.com
  27.  
  28. On Tue, 12 Nov 1996 14:09:34 +0100, Dirk.vanGulik wrote:
  29.  
  30. >Harald wrote:
  31. >> There are about 3 alternatives I can see:
  32. >A
  33. >> - The URN syntax doc says that URNs are sequences of ASCII
  34. >>   characters (or some subset thereof)
  35. >
  36. >B
  37. >> - The URN syntax doc says that URNs are sequences of OCTETS,
  38. >>   with no meaning assigned by the URN syntax doc after the
  39. >>   second :
  40. >
  41. >C
  42. >> - The URN syntax doc says that URNs are sequences of CHARACTERS,
  43. >>   drawn from the ISO 10646 set.
  44. >> The tradeoffs are different for the 3 cases.
  45. >
  46. >To extend on this, IMHO very sensible, concept: as it gives room
  47. >to sensible wire definitions:
  48. >
  49. >D. Augmenting, case 'B'; 
  50. >
  51. >The URN syntax docs says the URNs are sequences of
  52. >OCTETS, whose value comes from a specific range '*' with no meaning 
  53. >assigned by the URN sysntax doc after the first four octets (which 
  54. >are the indexes of the glyphs 'u','r','n' and ':' in charset-XYZ.)
  55. >
  56. >Where the range '*' is; when each octed is taken as in index  into
  57. >charset-XYZ, is from the range (say) A-Z, 0-9, '_', '-', ":' and '.'
  58. >
  59. >I'd suggest ISO-8859, US-ASCII, NISO, etc for charset-XYZ.
  60. >
  61. >For each naming scheme an interpretation/casting can be defined for 
  62. >the part of the URN after the name-scheme-identifier.
  63. >
  64. >For the 'inet' (or x-dns-2) name-schme; the suggested interpretation is
  65. >as indexes into 8 bit encoded 7bit ASCII (or ISO-8859-1 or whatever).
  66. >
  67. >Would that be of (some) use?
  68. >
  69. >The reason for _not_ allowing any octet in the string after urn: is to
  70. >avoid entering into the dark realm of having to retrive MIB like display
  71. >strings whenever you encounter a URN you've not seen before; and which
  72. >you would like to display to a human in such a way he/she can still
  73. >transcribe it. Just showing a list of two digit hex numbers would not do.
  74. >
  75. >Although overloading yet another DNS query type to get the display string
  76. >could be fun on the 'display-string'.name-scheme.urn.net level :-)
  77. >
  78. >Dw.
  79.  
  80. To me, the extension (as written) has a couple of holes.  The URN has to have
  81. information about the namespace so that the resolver can resolve the URN
  82. correctly (it took me a while to realize that the proper parsing of option B is
  83. the second ":").  Therefore, having no meaning after the optional "urn:"
  84. doesn't work.
  85.  
  86. The second hole is that while having an interpretation for a specific namespace
  87. defined in a separate namespace document is reasonable (in fact I don't see
  88. how to avoid it) defining general castings in external documents doesn't
  89. strike me as a big win.  I still believe we can keep the syntax doc reasonably
  90. short while solving the small problem in front of us.
  91.  
  92. This being said, if the holes are plugged up, option D could be a reasonable
  93. alternative
  94.  
  95. Now, back to Harald's proposals, I'll try to synopsize them with my thoughts 
  96. on the tradeoffs
  97.  
  98. >A
  99. >> - The URN syntax doc says that URNs are sequences of ASCII
  100. >>   characters (or some subset thereof)
  101.  
  102. This is of course, the simplest.  A minimum of transport encoding would be
  103. involved.  There may be some reserved characters that would be need to be
  104. encoded on a namespace specific basis but those could be done with
  105. %HH encoding.
  106.  
  107. >B
  108. >> - The URN syntax doc says that URNs are sequences of OCTETS,
  109. >>   with no meaning assigned by the URN syntax doc after the
  110. >>   second  ':'
  111.  
  112. I've modified the above to point up the ':' character.  This is the "opaque string"
  113. option.  This option would require some transport encoding for 8-bit unclean pipes.
  114. I see presentation as the major trade-off here.  For 8-bit unfriendly schemes,
  115. something like the %HH scheme would be needed.  For others, the %HH scheme
  116. could be mixed with actual glyphs that are representation of that octet (or sequence
  117. of octets) in that presentation scheme.  However, THIS IS ONLY FOR THE
  118. CONVIENCE OF THE PRESENTATION SCHEME, NOT THE USER!!!!
  119. The other difficulty is that reserved characters have to be limited to
  120. a subset of ASCII or there is the possibility for encoding collisions that would require
  121. the syntax doc to specify its own encoding scheme.
  122.  
  123. >C
  124. >> - The URN syntax doc says that URNs are sequences of CHARACTERS,
  125. >>   drawn from the ISO 10646 set.
  126. >> The tradeoffs are different for the 3 cases.
  127.  
  128. This last one has most of the issues above. There are probably others that I
  129. haven't thought of, mainly because I don't claim to be an expert in the ins and outs
  130. of 7-bit and 8-bit friendliness.
  131.  
  132. Having synopsized the plusses and minuses of these, there are some common issues:
  133.  
  134. If we restrict the range of octets for the NSS (this is option A and option D) then
  135. a lot of the trasnport encoding, reserved character encoding and related issues go away.
  136.  
  137. If we allow any octet (option B and C) then transport encoding becomes a minor issue
  138. and reserved character encoding must be considered.  
  139.  
  140. Everything else (to me right now at least) is related to presentation and meta-interpretation
  141. (by humans) of the NSS.  I'm not sure if these should intrude into the syntax doc.
  142.  
  143.